Table des matières

Introduction
I. Données
II. Plan d’analyse
III. Exploration
IV. Annexe

Introduction

 Nous avons choisi d’utiliser le jeu de données “World Population Prospects”, mis à disposition par l’Organisation des Nations Unies via leur site officiel : https://population.un.org/wpp

 Ce dataset est mis à jour tous les 2 ans environ, la version utilisée sera la dernière, celle de 2024. Plus précisément, ces documents sont édités et publiés par le DAES (DESA en anglais), le Département des Affaires Économiques et Sociales qui est un “secrétariat” (un organisme principal) de l’ONU qui produit et analyse des datasets afin de produire des rapports et aide les pays à prendre des décisions et à avoir des agendas de politiques au fait des enjeux sociétaux et économiques. Les rapports publics portent par exemple sur l’avancement des droits des femmes, de la jeunesse, des autochtones, mais aussi sur l’état et les objectifs futurs des forêts, des énergies renouvelables, de l’économie et donc aussi de la démographie.

 Ces données contiennent des projections démographiques standardisées pour l’ensemble des pays du monde, couvrant la période de 1950 à 2100. Les données de 1950 à 2023 sont des données issues de recensement de 238 pays/régions non-autonomes. Ce dataset constitue donc une source fiable, riche, et particulièrement pertinente dans un contexte de réflexion sur l’évolution des sociétés.



I. Données

Notre dataset est constitué de 15 fichiers CSV thématiques couvrant l’évolution démographique mondiale sous différentes facettes : population totale, fécondité, mortalité, migration, et bien d’autres. Il propose une exploration à travers quatre niveaux de granularité spatiale : mondial, régional, national, et urbain/rural. Les données sont également regroupées par tranches d’âge quinquennales, permettant une analyse fine de l’évolution au fil du temps.

De plus, trois scénarios prospectifs (bas, moyen, haut) ont été élaborés selon les politiques natalistes des États, projetant ainsi plusieurs futurs possibles pour l’humanité.
Ce vaste ensemble contient 84 360 observations réparties sur 42 variables, offrant une base solide pour comprendre les dynamiques démographiques passées, présentes et futures.

Chaque localisation est identifiée de manière unique, facilitant l’agrégation, la comparaison et l’interprétation des différentes séries temporelles disponibles.

Description des variables du dataset
Colonne Format Type de données Description
SortOrder int Discrète Ordre des lignes
LocID int Discrète Identifiant unique de la localisation
Notes string (nullable) Nominale Informations additionnelles
ISO3_code string (nullable) Nominale Code pays en 2 lettres selon la norme ISO 3166-1 alpha-3
ISO2_code string (nullable) Nominale Code pays en 2 lettres selon la norme ISO 3166-1 alpha-2
SDMX_code string (nullable) Nominale Code SDMX pour la localisation
LocTypeID int Discrète Type de la localisation
LocTypeName string Nominale Nom du type de localisation
ParentID int (nullable) Discrète Identifiant du parent (si la localisation fait partie d’une région)
Location string Nominale Nom de la région/localisation
VarID int Discrète Identifiant de la variable
Variant string Nominale Type de scénario démographique (ex. Medium)
Time int Ordinale Année
TPopulation1Jan float Continue Population totale au 1er janvier
TPopulation1July float Continue Population totale au 1er juillet
TPopulationMale1July float Continue Population masculine au 1er juillet
TPopulationFemale1July float Continue Population féminine au 1er juillet
PopDensity float Continue Densité de population (habitants/km²)
PopSexRatio float Continue Ratio hommes/femmes
MedianAgePop float Continue Âge médian de la population
NatChange float Continue Changement naturel de la population
NatChangeRT float Continue Taux de changement naturel
PopChange float Continue Changement total de la population
PopGrowthRate float Continue Taux de croissance démographique
DoublingTime float Continue Temps de doublement de la population
Births float Continue Nombre total de naissances
Births1519 float Continue Naissances chez les 15-19 ans
CBR float Continue Taux brut de natalité (pour 1000 habitants)
TFR float Continue Taux de fécondité total (nombre moyen d’enfants par femme)
NRR float Continue Taux net de reproduction
MAC float Continue Âge moyen de la maternité
SRB float Continue Ratio de masculinité à la naissance (nombre de garçons pour 100 filles)
Deaths float Continue Nombre total de décès
DeathsMale float Continue Nombre de décès masculins
DeathsFemale float Continue Nombre de décès féminins
CDR float Continue Taux brut de mortalité (pour 1000 habitants)
LEx float Continue Espérance de vie à la naissance
LExMale float Continue Espérance de vie des hommes
LExFemale float Continue Espérance de vie des femmes
LE15 float Continue Espérance de vie à 15 ans
LE15Male float Continue Espérance de vie des hommes à 15 ans
LE15Female float Continue Espérance de vie des femmes à 15 ans
LE65 float Continue Espérance de vie à 65 ans
LE65Male float Continue Espérance de vie des hommes à 65 ans
LE65Female float Continue Espérance de vie des femmes à 65 ans
LE80 float Continue Espérance de vie à 80 ans
LE80Male float Continue Espérance de vie des hommes à 80 ans
LE80Female float Continue Espérance de vie des femmes à 80 ans
InfantDeaths float Continue Nombre de décès infantiles
IMR float Continue Taux de mortalité infantile (pour 1000 naissances vivantes)
LBsurvivingAge1 float Continue Nombre d’enfants survivant jusqu’à 1 an
Under5Deaths float Continue Nombre de décès avant 5 ans
Q5 float Continue Probabilité de mourir avant 5 ans
Q0040, Q0040Male, Q0040Female float Continue Probabilité de mourir entre 0 et 40 ans (total, hommes, femmes)
Q0060, Q0060Male, Q0060Female float Continue Probabilité de mourir entre 0 et 60 ans (total, hommes, femmes)
Q1550, Q1550Male, Q1550Female float Continue Probabilité de mourir entre 15 et 50 ans (total, hommes, femmes)
Q1560, Q1560Male, Q1560Female float Continue Probabilité de mourir entre 15 et 60 ans (total, hommes, femmes)
NetMigrations float Continue Migration nette (immigrants - émigrants)
CNMR float Continue Taux net de migration (pour 1000 habitants)

II. Plan d’analyse

Ce jeu de données permet d’étudier en profondeur les dynamiques démographiques mondiales, passées et futures. Notre objectif principal est d’en extraire des tendances visuelles à l’échelle globale, régionale et nationale, et de les mettre en relation avec des enjeux actuels (vieillissement, natalité…).

1. Dynamiques démographiques différentielles

L’objectif de cette partie sera principalement d’observer les trajectoires démographiques historiques (1950-2023) et projetées (2024-2100) à travers les trois scénarios SSP. Il s’agira à la fois de visualiser par région l’évolution démographique mais aussi de visualiser les 3 scénarios du futur démographique (SSP1, SSP2, SSP3). On se servira de line charts multiples pour chercher des croissances et décroissances.

2. Natalité, fécondité et Santé

L’un des piliers de la démographie est la natalité. Nous chercherons à comprendre comment elle a évolué au cours des 70 dernières années en analysant le Total Fertility Rate (TFR). Nous examinerons également la corrélation entre la mortalité infantile et la fécondité, en croisant ces données avec celles des grossesses adolescentes.

3. Structure par âge et dividende démographique

Nous chercherons à comprendre à quel moment une population entre dans une phase de dividende démographique, lorsque la part de la population en âge de travailler (15–64 ans) dépasse largement celle des jeunes (0–14 ans) et des personnes âgées (65+). L’analyse portera sur l’évolution de la structure par âge au cours du temps, afin d’identifier les pays qui bénéficient ou bénéficieront d’une fenêtre démographique favorable à la croissance et au développement.








III. Exploration

1. Comment le taux de fécondité total (TFR) a-t-il évolué entre 1950 et 2023 dans les cinq continents ?

Nous supposons que le TFR a globalement diminué sur tous les continents depuis 1950 avec des disparités régionales marquées (ex : déclin plus rapide en Europe qu’en Afrique). Le taux de fécondité total est le nombre d’enfant vivant à la naissance par femme. On ne compte pas ici l’indice de survie des enfants. Nous respecterons la division en continent de l’Amérique en quatre entités (South America, Central America, the Caribbean, and Northern America) faite par l’ONU dans ce dataset.

La baisse globale du TFR, passant de 4,7 en 1950 à 2,3 en 2023, dissimule des réalités hétérogènes en fonction du continent.

  En Afrique, le TFR a connu un déclin relatif mais inachevé, diminuant de 6,7 à 4,3 sur 73 ans. Cette transition lente peut s’expliquer par la persistance de normes pro-natalistes, par un accès limité à la contraception, la baisse faible de la mortalité infantile, divisée par quatre depuis 1950 qui n’a pas encore entraîné un ajustement proportionnel des comportements reproductifs (la seconde phase de la transition démographique).

  En Europe, le TFR a continuellement baissé dès les années 1970 pour atteindre 1,5 en 2023. L’Europe est sous le seuil de renouvellement depuis 1975, sans immigration la population aurait largement diminué.

  On peut voir des données intéressantes des années 1950 à 1975. Si l’Amérique du Sud a une baisse continue et linéaire, l’Asie connaît des rebonds et de fortes baisses. En effet, l’année 1961, celle de la plus grande baisse, peut être corrélée avec la Grande famine chinoise (1959-1961). Mais sous cette moyenne se cache de grande disparité : dans six pays (Chine, Corée du Nord, Corée du Sud, Japon, Singapour, Thaïlande), la transition de la fécondité est largement achevée avec un nombre moyen d’enfants par femme qui est désormais inférieur au seuil de remplacement des génération. Le Japon, Singapour et la Corée du Sud se caractérisent même par des niveaux de fécondité parmi les plus bas au monde, inférieurs à 1,4 enfant par femme (faisant d’eux des ‘lowest-low’ fertility countries). La Chine, grâce à sa politique coercitive de l’enfant unique, a évité 400 millions de naissances, mais au prix d’un déséquilibre de genre historique. L’Inde, via des campagnes volontaristes comme “Us two, our two” (un couple, deux enfants), a réduit son TFR de 5,7 à 2,0.

  L’Océanie, avec un TFR moyen de 2,1, cache des fractures invisibles. L’Australie et la Nouvelle-Zélande (1,6) contrastent avec la Mélanésie, où la Papouasie-Nouvelle-Guinée maintient un TFR de 3,2.

  Du côté des Amériques, deux schémas sont présents. L’Amérique du Nord (Northen America ou Amérique septentrionale) composé des États-Unis, du Canada ainsi que des Bermudes (Royaume-Uni), du Groenland (Danemark) et de Saint-Pierre-et-Miquelon (France), suit une courbe très proche de celle de l’Europe. Le reste des Amériques; centrale, du sud et les Caraïbes ; suivent une trajectoire similaire à l’Asie avec une baisse qui les emmène tous en dessous du seuil de renouvellement.

2. Quels sont les 10 pays ayant connu les plus fortes croissances et décroissances démographiques entre 1950 et 2023 ?

Dans cette partie, nous allons nous intéresser à la question suivante : Quels sont les 10 pays ayant connu les plus fortes croissances et décroissances démographiques entre 1950 et 2023 ?

Pour y répondre, nous avons tout d’abord chargé et nettoyé les données issues du fichier Dem_1950-2023.xlsx, qui regroupe les estimations de population par pays et par année. Nous avons principalement utilisé trois variables : le nom du pays (Country), l’année d’estimation (Year, de 1950 à 2023) et la population totale au 1er janvier (Population, en milliers d’habitants). Après avoir filtré pour ne garder que les vrais pays, nous avons extrait la population de 1950 et celle de 2023 pour chacun d’eux. Cela nous a permis de calculer le changement absolu (différence brute) ainsi que le changement relatif (en pourcentage) de la population sur cette période.

Plutôt que de nous limiter à un calcul absolu de l’augmentation de population qui aurait favorisé mécaniquement les pays les plus peuplés nous avons choisi d’analyser la croissance relative. Cette approche nous permet de mieux saisir l’intensité des transformations démographiques, indépendamment de la taille initiale des pays.


















En observant les deux graphiques, on peut dire qu’ils répondent bien à la question posée : analyser les pays ayant connu la plus forte croissance et décroissance démographique relative entre 1950 et 2023. Le premier graphique, avec une échelle horizontale sur le changement en pourcentage, montre que des pays comme les Émirats Arabes Unis (+14 000%) et le Qatar, dont la forte augmentation démographique peut être attribuée à des facteurs économiques tels que l’exploitation des ressources pétrolières, attirant ainsi une immigration massive. À l’inverse, le graphique de décroissance met en évidence des pays comme Montserrat (-66%) ou Niue (-59%), où la diminution de population semble être liée à des catastrophes naturelles ou une émigration importante. Cependant, ces graphiques soulèvent également de nouvelles questions. Par exemple, l’exemple de l’Ukraine, avec une croissance très modérée, pointe les effets des conflits géopolitiques sur les dynamiques démographiques

Enfin, ces graphiques invitent à une réflexion sur l’évolution temporelle des populations. En étudiant plus en profondeur les changements démographiques sur plusieurs décennies, on pourrait comprendre précisément à quel moment ces transformations ont eu lieu, en fonction des événements mondiaux ou locaux.
















En observant les graphiques en lignes des pays à forte croissance, on remarque que le Qatar et les Émirats Arabes Unis (UAE) ont vu leur population exploser après les années 1970. Cela pourrait être lié à l’exploitation des ressources pétrolières, attirant une main-d’œuvre étrangère.

Concernant la décroissance démographique, l’Ukraine présente une tendance intéressante : après une légère croissance jusqu’en 1994, le déclin démographique s’est intensifié après 1991, potentiellement en raison de l’effondrement soviétique et de la crise économique qui en a résulté. La guerre récente pourrait expliquer l’accélération de cette décroissance à partir de 2021, avec des migrations forcées et une forte perte de population.La Lettonie, aussi issue de l’ex-URSS, montre une décroissance similaire après 1991

En conclusion, ces graphiques répondent bien à la question posée et permettent d’observer les évolutions démographiques mondiales entre 1950 et 2023. Ils mettent en lumière des pays ayant connu une croissance ou une décroissance démographique significative. Si l’on s’attendait à voir davantage de pays africains parmi les résultats, cela pourrait être dû à la période choisie. Une analyse sur des périodes plus récentes pourrait révéler des tendances démographiques plus marquées en Afrique.

3. Quels sont les 10 pays avec les taux de mortalité infantile les plus faibles et les plus élevés en moyenne entre 2000 et 2023 ?

Nous formulons l’hypothèse que le taux de mortalité infantile en 2023 est fortement corrélé au niveau de développement économique et sanitaire des pays.
Les pays en développement, notamment d’Afrique subsaharienne, devraient présenter des taux élevés en raison d’un accès limité aux soins médicaux, à la vaccination, et à une nutrition adéquate.
À l’inverse, les pays développés devraient afficher des taux très faibles, bénéficiant d’infrastructures de santé performantes, d’une meilleure hygiène de vie et d’une politique de prévention efficace.
Nous nous attendons ainsi à observer un écart important entre les pays les plus riches et les pays les plus pauvres.

Afin de répondre à cette question, nous avons réalisé le graphique suivant à partir du jeu de données WPP 2024.

Le graphique met en évidence des écarts très marqués entre les pays en termes de mortalité infantile moyenne sur la période 2000-2023.
On observe que les pays présentant les taux les plus élevés sont principalement situés en Afrique subsaharienne, comme la Sierra Leone, le Nigéria ou le Tchad.
Ces taux élevés traduisent des défis persistants en matière d’accès aux soins prénatals, de couverture vaccinale, de nutrition infantile et d’infrastructures hospitalières.
À l’inverse, les pays affichant les taux les plus faibles, tels que l’Islande, Singapour ou Hong Kong, disposent de systèmes de santé robustes, d’un suivi médical généralisé dès la naissance, ainsi que d’importants programmes de prévention et d’éducation sanitaire.
Cet écart très marqué entre pays en développement et pays développés confirme notre hypothèse de départ : le niveau de développement économique, sanitaire et éducatif est un déterminant majeur du taux de mortalité infantile.
Ces résultats soulignent aussi l’importance des politiques publiques de santé dans la réduction des inégalités sanitaires à l’échelle mondiale.

4. Quels sont les 10 pays représentant la plus forte part de la population mondiale en 2023 ?

Nous formulons l’hypothèse que la distribution de la population mondiale en 2023 est fortement concentrée dans quelques grands pays à forte démographie.
Des pays comme la Chine, l’Inde, les États-Unis ou l’Indonésie devraient figurer parmi les principaux contributeurs à la population mondiale en raison de leur immense taille démographique historique et de leur dynamique de croissance soutenue.
Nous nous attendons donc à observer une forte concentration de la population mondiale dans un nombre relativement restreint de pays.

Afin de répondre à cette question, nous avons réalisé le graphique suivant à partir du jeu de données WPP 2024 (World Population Prospects), en se concentrant sur l’année 2023.

Le graphique obtenu montre que la population mondiale est effectivement très concentrée dans quelques grands pays. On observe que l’Inde et la Chine dominent largement, représentant à eux seuls une part considérable de la population mondiale, suivis par des pays comme les États-Unis, l’Indonésie, le Pakistan ou encore le Nigeria.

Cette forte concentration est le reflet de tendances historiques : natalité élevée dans certaines régions, urbanisation massive, dynamiques économiques diverses, et transitions démographiques différenciées selon les pays.
















IV. Annexe

Pour la réalisation de ce projet, nous nous sommes réparties les taches de la manière suivante :

  • Tous les membres du groupe ont travaillé conjointement sur la rédaction de la proposition Read.Me.
  • En ce qui concerne la partie exploration nous nous sommes répartis les questions de la manière suivante :
    • Robin : 1. Comment le taux de fécondité total (TFR) a-t-il évolué entre 1950 et 2023 dans les cinq continents ?
    • Othmane : 2. Quels sont les 10 pays ayant connu les plus fortes croissances et décroissances démographiques entre 1950 et 2023 ?
    • Nicolas : 3. Quels sont les 10 pays avec les taux de mortalité infantile les plus faibles et les plus élevés en moyenne entre 2000 et 2023 ?
    • Zakaria : 4. Quels sont les 10 pays représentant la plus forte part de la population mondiale en 2023 ?